正規表達式(Regular Expressions),簡稱Regex或RegExp,是一種強大的字串處理工具,用於在文本中搜尋、匹配、替換和驗證特定模式的字串。它們在程式設計、文字處理、數據分析和其他領域中都有廣泛的應用。本文將介紹正規表達式的基本概念、語法元素和一些實用示例。
正規表達式的基本概念
字面字符匹配:正規表達式可以用來匹配字面字符,例如字母、數字或符號。例如,正規表達式 abc 將匹配字符串中的 "abc"。
特殊字符:正規表達式中有一些特殊字符,如 .、、+、?,它們有特殊的含義。例如,. 匹配任何字符, 匹配前一個模式的零個或多個實例,+ 匹配一個或多個實例,? 匹配零個或一個實例。
字符集:使用方括號 [] 可以定義一個字符集,匹配其中的任何字符。例如,[abc] 匹配 "a"、"b" 或 "c" 中的任何一個字符。
範圍:字符集中可以使用短橫線 - 定義一個字符範圍。例如,[0-9] 匹配任何一個數字。
反義:在字符集前加上 ^ 可以匹配不在字符集中的字符。例如,[^0-9] 匹配任何非數字字符。
正規表達式的語法元素
匹配開始和結束:^ 用於匹配字符串的開始,$ 用於匹配字符串的結束。
重複次數:使用 {} 指定重複次數。例如,a{3} 匹配 "aaa",a{1,3} 匹配 "a"、"aa" 或 "aaa"。
選擇:使用 | 表示或的關係。例如,cat|dog 匹配 "cat" 或 "dog"。
捕獲群組:使用圓括號 () 可以捕獲一個子模式,以便稍後引用或進行處理。
轉義:對於特殊字符,如果需要匹配它們的字面值,則需要使用反斜杠 \ 進行轉義。例如,. 匹配句點字符。
預定義字符集:正規表達式中有一些預定義的字符集,如 \d 匹配任何數字字符,\w 匹配任何單詞字符,\s 匹配任何空白字符。
參考資料:https://www.runoob.com/python3/python3-reg-expressions.html